Thị Giác Máy Tính - Deep Learning | Computer Vision
45
106 LƯỢT XEM
NỘI DUNG MÔN HỌC
Khóa học Deep Learning này cung cấp góc nhìn toàn diện về lĩnh vực Deep Learning, từ cơ bản đến nâng cao. Học viên sẽ được học lý thuyết kết hợp với thực hành qua các bài tập và dự án thực tế. Khóa học bao gồm các chủ đề như Neural Networks, Convolutional Neural Networks (CNNs), Recurrent Neural Networks (RNNs), Long Short-Term Memory (LSTM), Attention mechanism, Transformer, và Auto Encoders. Ngoài ra, khóa học cũng giới thiệu các ứng dụng hiện đại của Deep Learning trong xử lý ảnh, xử lý ngôn ngữ tự nhiên, và sinh dữ liệu.
Nội dung được thiết kế để xây dựng trên nền tảng kiến thức từ khóa học Deep Learning trước đó, đồng thời cung cấp kiến thức chuyên sâu về Computer Vision.
Thời lượng: 45 giờ
Sau khi hoàn thành khóa học, học viên có khả năng:
- Thành thạo sử dụng thư viện OpenCV cho xử lý ảnh và video
- Hiểu sâu về các kiến trúc CNN tiên tiến như ResNet và ứng dụng trong phân loại hình ảnh
- Nắm vững các kỹ thuật nhận diện đối tượng hiện đại như R-CNN và YOLO
- Áp dụng được Transfer Learning với Tensorflow Hub và PyTorch Hub
- Có khả năng xây dựng và triển khai các ứng dụng Computer Vision trong thực tế
- Học viên sẽ được cấp chứng nhận hoàn tất khóa học theo quy định của ITSTARVN.
1. Thư viện OpenCV (10 giờ)
- Bài 1: Giới thiệu về OpenCV (2 giờ)
- Tổng quan về OpenCV và ứng dụng trong Computer Vision
- Cài đặt và cấu hình OpenCV
- Đọc, hiển thị và lưu ảnh/video với OpenCV
- Bài 2: Xử lý ảnh cơ bản với OpenCV (3 giờ)
- Thao tác pixel và vùng ảnh
- Biến đổi hình học (resize, rotate, affine transformations)
- Lọc ảnh và làm mịn (blurring, sharpening)
- Bài 3: Xử lý ảnh nâng cao với OpenCV (3 giờ)
- Phát hiện cạnh (Canny, Sobel)
- Phân ngưỡng ảnh (thresholding)
- Phân đoạn ảnh (image segmentation)
- Bài 4: Xử lý video với OpenCV (2 giờ)
- Đọc và xử lý video streams
- Trích xuất frames và optical flow
- Dự án mini: Tạo ứng dụng theo dõi đối tượng đơn giản
2. Phân loại hình ảnh và Kiến trúc ResNet (12 giờ)
- Bài 5: Ôn tập CNN và chuẩn bị dữ liệu (3 giờ)
- Ôn tập kiến trúc CNN cơ bản
- Augmentation và tiền xử lý dữ liệu hình ảnh
- Xây dựng pipeline dữ liệu hiệu quả với tf.data hoặc PyTorch DataLoader
- Bài 6: Kiến trúc ResNet (3 giờ)
- Giới thiệu về vấn đề vanishing gradient trong mạng sâu
- Cơ chế skip connection và residual learning
- Các biến thể của ResNet (ResNet50, ResNet101, ResNet152)
- Bài 7: Implement và huấn luyện ResNet (3 giờ)
- Xây dựng kiến trúc ResNet từ đầu với TensorFlow hoặc PyTorch
- Kỹ thuật huấn luyện hiệu quả cho mạng sâu
- Theo dõi và đánh giá quá trình huấn luyện
- Bài 8: Fine-tuning và đánh giá mô hình ResNet (3 giờ)
- Fine-tuning ResNet trên bộ dữ liệu tùy chỉnh
- Kỹ thuật đánh giá mô hình phân loại hình ảnh
- Dự án: Xây dựng ứng dụng phân loại hình ảnh với ResNet
3. Nhận diện đối tượng (12 giờ)
- Bài 9: Giới thiệu về nhận diện đối tượng (2 giờ)
- Tổng quan về bài toán nhận diện đối tượng
- So sánh với bài toán phân loại và phân đoạn ảnh
- Các metrics đánh giá: IoU, mAP
- Bài 10: Kiến trúc R-CNN và biến thể (3 giờ)
- Giới thiệu về R-CNN
- Fast R-CNN và Faster R-CNN
- Mask R-CNN cho instance segmentation
- Bài 11: YOLO (You Only Look Once) (3 giờ)
- Nguyên lý hoạt động của YOLO
- So sánh YOLO với R-CNN
- Các phiên bản của YOLO (v3, v4, v5)
- Bài 12: Implement và huấn luyện mô hình nhận diện đối tượng (4 giờ)
- Chuẩn bị dữ liệu cho bài toán nhận diện đối tượng
- Implement YOLO hoặc Faster R-CNN với TensorFlow/PyTorch
- Huấn luyện và đánh giá mô hình
- Dự án: Xây dựng ứng dụng nhận diện đối tượng thời gian thực
4. Transfer Learning với TensorFlow Hub/ PyTorch Hub (11 giờ)
- Bài 13: Giới thiệu về Transfer Learning (2 giờ)
- Nguyên lý và lợi ích của Transfer Learning
- Các scenario trong Transfer Learning
- So sánh Transfer Learning với training from scratch
- Bài 14: TensorFlow Hub (3 giờ)
- Giới thiệu về TensorFlow Hub
- Sử dụng pre-trained models từ TensorFlow Hub
- Fine-tuning models từ TensorFlow Hub
- Bài 15: PyTorch Hub (3 giờ)
- Giới thiệu về PyTorch Hub
- Sử dụng pre-trained models từ PyTorch Hub
- Fine-tuning models từ PyTorch Hub
- Bài 16: Ứng dụng Transfer Learning trong Computer Vision (3 giờ)
- Transfer Learning cho phân loại hình ảnh
- Transfer Learning cho nhận diện đối tượng
- Dự án cuối khóa: Xây dựng ứng dụng Computer Vision sử dụng Transfer Learning
/* Nội dung chương trình có thể thay đổi theo yêu cầu đào tạo của Doanh nghiệp */
------------------------------------